Test 3

Sistema de Puntuación:

Respuesta correcta: Suma +0.25 puntos.
Respuesta incorrecta: Resta -0.08333... puntos (o la fracción 1/12).
Respuesta en blanco (no contestada): Suma o resta 0 puntos (no afecta la puntuación).

1. Si necesitas extraer todos los enlaces (<a>) de una página que apuntan a un dominio externo específico, ¿cómo podrías filtrar los resultados de soup.find_all('a')? (Asume que enlaces es la lista de todas las etiquetas <a>)

2. Para implementar una comprobación de "contenido mixto" (recursos HTTP en una página HTTPS), necesitas inspeccionar atributos como src en <img> y <script>, y href en <link>. Si tu página principal es HTTPS, ¿cuál sería una condición de BeautifulSoup para identificar un recurso de imagen problemático?

3. Al verificar las etiquetas hreflang para SEO internacional, buscas etiquetas <link rel="alternate" hreflang="...">. ¿Cómo encontrarías todas estas etiquetas y luego accederías al valor del atributo hreflang para la primera etiqueta encontrada (hreflang_tag)?

4. Quieres asegurarte de que una página responsive tenga la meta etiqueta viewport correctamente configurada. ¿Cuál es la forma más precisa de buscar la etiqueta <meta name="viewport">?

5. Al iterar sobre una lista de td_elements obtenida con soup.find_all('td'), ¿cómo extraerías el texto limpio (sin espacios extra al inicio/final) de cada celda?

6. Si necesitas verificar la existencia de un favicon declarado como <link rel="icon" href="/favicon.ico"> o <link rel="shortcut icon" href="/favicon.ico">, ¿cuál opción de BeautifulSoup es más flexible para encontrar cualquiera de estas dos formas?

7. En un ejercicio para extraer datos de una tabla (<table>), si quieres obtener todas las filas (<tr>) y luego, para cada fila, obtener todas sus celdas (<td>), ¿cuál sería la estructura de bucle anidado más común con BeautifulSoup?

8. ¿Cuál es el propósito principal de usar if soup.title else "No encontrado" al intentar extraer el texto de un título?

9. Si estás comprobando enlaces internos rotos, y tienes una URL base https://example.com, un enlace como href="/pagina" se considera interno. ¿Cómo construirías la URL completa para hacer una petición requests.get() a este enlace relativo?

10. Al realizar una auditoría SEO, se crea un diccionario info para luego convertirlo a un DataFrame de Pandas. Si quieres registrar si Google Analytics está presente buscando subcadenas como "UA-" o "G-" en response.text (el contenido HTML crudo), ¿cuál es una forma pythonica de hacerlo?